检索结果

Select

1. 基于深度学习的RGB图像目标位姿估计综述

王一, 谢杰, 程佳, 豆立伟

《计算机应用》唯一官方网站 2023, 43 (8): 2546-2555. DOI: 10.11772/j.issn.1001-9081.2022071022

摘要（691）

HTML （29）

PDF （858KB）（520）

6自由度（DoF）位姿估计是计算机视觉与机器人技术中的一项关键技术，它能从给定的输入图像中估计物体的6DoF位姿，即3DoF平移和3DoF旋转，已经成为机器人操作、自动驾驶、增强现实等领域中的一项至关重要的任务。首先，介绍了6DoF位姿的概念以及基于特征点对应、基于模板匹配、基于三维特征描述符等传统方法存在的问题；然后，以基于特征对应、基于像素投票、基于回归和面向多物体实例、面向合成数据、面向类别级的不同角度详细介绍了当前主流的基于深度学习的6DoF位姿估计算法，归纳整理了在位姿估计方面常用的数据集以及评价指标，并对部分算法进行了实验性能评价；最后，给出了当前位姿估计面临的挑战和未来的重点研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于注意力机制和迁移学习的古壁画朝代识别

张慧斌, 冯丽萍, 郝耀军, 王一宁

《计算机应用》唯一官方网站 2023, 43 (6): 1826-1832. DOI: 10.11772/j.issn.1001-9081.2022071008

摘要（298）

HTML （13）

PDF （1804KB）（208）

卷积神经网络（CNN）已成功用于敦煌古壁画的朝代分类。针对敦煌壁画的数据量有限，采用某些数据增强方法对训练集进行扩充时反而会降低预测准确率的问题，提出了一种基于注意力机制和迁移学习的残差网络（ResNet）模型。首先，改进了残差网络的残差连接方式；然后，使用极化自注意力（POSA）模块帮助网络模型提取图像的边缘局部细节特征和全局轮廓特征，增强网络模型在小样本环境下的学习能力；最后，改进分类器的算法，提高网络模型的分类性能。实验结果表明，所提模型在敦煌壁画DH1926小样本数据集上，取得了98.05%的朝代分类准确率，与标准的ResNet20网络模型相比，所提模型的朝代识别准确率提高了5.21个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 考虑订单扰动因素的热轧重调度分布估计算法

王一荻, 李志伟, 张文新, 李铁克, 王柏琳

《计算机应用》唯一官方网站 2022, 42 (8): 2628-2636. DOI: 10.11772/j.issn.1001-9081.2021061106

摘要（212）

HTML （5）

PDF （757KB）（79）

热轧工序作为钢铁生产的核心环节，具有严格的生产连续性和复杂的产品工艺要求，而紧急订单的随机到达和紧急交货期要求会对生产连续性和质量稳定性产生不利影响。针对这类紧急订单插入的动态事件，提出一种热轧重调度优化方法。首先，分析了订单扰动因素对调度方案的影响，并以最小化订单拖期惩罚和板坯跳跃惩罚加权和为优化目标，建立了热轧重调度问题的数学模型。然后，设计了热轧重调度分布估计算法（EDA）。该算法针对紧急订单的插入式处理方式，提出一种基于插入位置的整数编码方案；结合模型特征设计了概率模型；并综合考虑目标与约束，定义了基于惩罚值的适应度函数。通过实际生产数据进行仿真实验，验证了模型和算法的可行性和有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于轻量密集神经网络的医学图像超分辨率重建算法

王一宁, 赵青杉, 秦品乐, 胡玉兰, 宗春梅

《计算机应用》唯一官方网站 2022, 42 (8): 2586-2592. DOI: 10.11772/j.issn.1001-9081.2021061093

摘要（430）

HTML （20）

PDF （1357KB）（223）

医学图像的清晰与否直接影响临床诊断。由于成像设备与环境因素的限制，往往不能直接获得高分辨率的图像，且大多数智能终端的硬件并不适合运行大规模深度神经网络模型，因此提出一种拥有较少的层和参数的轻量密集神经网络模型。首先，网络中使用密集块和跳层结构进行全局和局部图像特征学习，并将更多特征信息传入激活函数，从而使网络中浅层低级的图像特征更容易传播到高层，由此提高医学图像超分辨率重建的质量；然后，采用分阶段方法训练网络，并以双任务损失加强网络学习中的监督指导，从而解决高倍图像超分辨率重建导致的网络训练难度增加的问题。实验结果表明，与最近邻（NN）插值、双线性插值、双立方插值、基于卷积神经网络（CNN）的算法以及基于残差神经网络的算法相比，所提模型能更好地重建出医学图像的纹理细节，获得更高的峰值信噪比（PSNR）和结构相似性（SSIM），在训练速度和硬件消耗方面均取得了良好的效果，具有较高的实用价值。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 融合成对编码方案及二维卷积神经网络的长短期会话推荐算法

陈学勤, 陶涛, 张钟旺, 王一蕾

《计算机应用》唯一官方网站 2022, 42 (5): 1347-1354. DOI: 10.11772/j.issn.1001-9081.2021030467

摘要（300）

HTML （9）

PDF （1011KB）（107）

虽然基于循环神经网络（RNN）的会话推荐算法可以有效地对会话中的长期依赖关系进行建模，并且可以结合注意力机制来刻画用户在会话中的主要目的，但它在进行会话建模的过程中无法绕过与用户主要目的不相关的物品，易受其影响以致降低推荐精度。针对上述问题，设计了成对编码方案来将原始输入序列嵌入向量转化为一个三维张量表示，使得非相邻的行为也能够产生联系。通过二维卷积神经网络（CNN）来处理该张量以捕获非相邻物品间的联系，并提出了引入用于会话推荐的二维卷积神经网络的神经注意力推荐机（COS-NARM）模型。该模型能有效跳过序列中与用户主要目的不相关的物品。实验结果表明，COS-NARM模型在DIGINETICA等多个真实数据集上的召回率和平均倒数排名（MRR）都得到了不同程度的提升，且优于NARM、GRU-4Rec+等所有基线模型。在上述研究的基础上，将欧氏距离引入COS-NARM模型，提出了OCOS-NARM模型。利用欧氏距离直接计算不同时刻兴趣间的相似度以减少模型的参数，降低模型的复杂度。实验结果表明，欧氏距离的引入不仅使得OCOS-NARM模型在DIGINETICA等多个真实数据集上的推荐效果得到了进一步的提升，而且使OCOS-NARM模型的训练时间相较COS-NARM模型缩短了14.84%，有效提高了模型的训练速度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 基于深度学习的小样本中药材粉末显微图像识别

王一丁, 郝晨宇, 李耀利, 蔡少青, 袁媛

计算机应用 2020, 40 (5): 1301-1308. DOI: 10.11772/j.issn.1001-9081.2019091646

摘要（587）

PDF （1619KB）（636）

针对中药材种类繁多、数据量稀少以及难以对其导管进行分类的问题，提出一种基于多通道颜色空间与注意力机制模型的卷积神经网络改进方法。首先，采用多通道颜色空间将RGB颜色空间与其他颜色空间合并为6通道作为网络输入，使网络学习亮度、色调和饱和度等特征信息，弥补数据量的不足；其次，在网络中加入注意力机制模型，其中通道注意力模型将两个池化层紧密连接到一起，空间注意力模型将多尺度空洞卷积结合到一起，使网络将注意力聚焦于小样本中关键的特征信息。实验结果表明，针对34种中药材样本的8 774张导管图像，采用多通道颜色空间和注意力机制模型的方法，与原始ResNet网络相比，准确率分别提升了1.8个百分点和3.1个百分点，将二者结合后准确率提升了4.1个百分点，说明所提方法对小样本分类的准确率有着大幅度的提升。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于专家特征的条件互信息多标记特征选择算法

程玉胜, 宋帆, 王一宾, 钱坤

《计算机应用》唯一官方网站 2020, 40 (2): 503-509. DOI: 10.11772/j.issn.1001-9081.2019091626

摘要（471）

HTML （0）

PDF （818KB）（288）

特征选择对于分类器的分类精度和泛化性能起重要作用。目前的多标记特征选择算法主要利用最大相关性最小冗余性准则在全部特征集中进行特征选择，没有考虑专家特征，因此多标记特征选择算法的运行时间较长、复杂度较高。实际上，在现实生活中专家依据几个或者多个关键特征就能够直接决定整体的预测方向。如果提取关注这些信息，必将减少特征选择的计算时间，甚至提升分类器性能。基于此，提出一种基于专家特征的条件互信息多标记特征选择算法。首先将专家特征与剩余的特征相联合，再利用条件互信息得出一个与标记集合相关性由强到弱的特征序列，最后通过划分子空间去除冗余性较大的特征。该算法在7个多标记数据集上进行了实验对比，结果表明该算法较其他特征选择算法有一定优势，统计假设检验与稳定性分析进一步证明了所提出算法的有效性和合理性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

8. 同一场景下超大尺度差异物体的识别和定位方法

王一婷, 张柯, 李捷, 郝宗波, 段昶, 朱策

计算机应用 2020, 40 (12): 3520-3525. DOI: 10.11772/j.issn.1001-9081.2020040466

摘要（365）

PDF （1355KB）（432）

近年来，深度学习在物体检测方面取得了非常好的效果和突飞猛进的发展，但在某些特殊场景下，如要求同时检测尺度相差极大的目标物体（相差大于100倍）时，现有的物体识别方法的性能急剧下降。针对同一场景下超大尺度差异物体识别与定位问题，对YOLOv3框架进行了改进，结合图像金字塔技术来提取图像的多尺度特征；并在训练过程中，针对不同尺度的目标提出采用动态交并比（IoU）的策略，此策略可以更好地解决样本不均衡的问题。实验结果表明，该模型对同一场景下超大超小物体的识别能力有了明显的提升。将之应用于机场环境，取得了较好的应用效果。

参考文献 | 相关文章 | 多维度评价

Select

9. 盲去模糊的多尺度编解码深度卷积网络

贾瑞明, 邱桢芝, 崔家礼, 王一丁

计算机应用 2019, 39 (9): 2552-2557. DOI: 10.11772/j.issn.1001-9081.2019020373

摘要（701）

PDF （1078KB）（465）

针对拍摄场景中物体运动不一致所带来的非均匀模糊，为提高复杂运动场景中去模糊的效果，提出一种多尺度编解码深度卷积网络。该网络采用"从粗到细"的多尺度级联结构，在模糊核未知条件下，实现盲去模糊；其中，在该网络的编解码模块中，提出一种快速多尺度残差块，使用两个感受野不同的分支增强网络对多尺度特征的适应能力；此外，在编解码之间增加跳跃连接，丰富解码端信息。与2018年国际计算机视觉与模式识别会议（CVPR）上提出的多尺度循环网络相比，峰值信噪比（PSNR）高出0.06 dB；与2017年CVPR上提出的深度多尺度卷积网络相比，峰值信噪比和平均结构相似性（MSSIM）分别提高了1.4%和3.2%。实验结果表明，该网络能快速去除图像模糊，恢复出图像原有的边缘结构和纹理细节。

参考文献 | 相关文章 | 多维度评价

Select

10. 基于智能手机运动传感器的步态特征身份识别方法

孔菁, 郭渊博, 刘春辉, 王一丰

计算机应用 2019, 39 (6): 1747-1752. DOI: 10.11772/j.issn.1001-9081.2018102161

摘要（533）

PDF （1043KB）（310）

利用行为特征进行身份验证是生物识别的前沿技术。为优化基于步态特征的身份识别研究中对数据的处理并改进识别的方式，提出利用智能手机运动传感器数据提取步态特征用于身份识别的方法。首先，应用空间转换算法解决传感器坐标系漂移问题，使数据可以完整准确地刻画行为特征；然后，利用支持向量机（SVM）算法对用户切换所导致的步态特征变化进行分类识别。实验结果表明，经过欧拉角法处理后，所提方法识别准确率达到95.5%，在有效识别用户变换的同时降低了空间开销和实现难度。

参考文献 | 相关文章 | 多维度评价

Select

11. 融合萤火虫方法的多标签懒惰学习算法

程玉胜, 钱坤, 王一宾, 赵大卫

计算机应用 2019, 39 (5): 1305-1311. DOI: 10.11772/j.issn.1001-9081.2018109182

摘要（518）

PDF （1074KB）（309）

已有的多标签懒惰学习算法（IMLLA）在利用近邻标签时因仅考虑了近邻标签相关性信息，而忽略相似度的影响，这可能会使算法的鲁棒性有所降低。针对这个问题，引入萤火虫方法，将相似度信息与标签信息相结合，提出一种融合萤火虫方法的多标签懒惰学习算法（FF-MLLA）。首先，利用Minkowski距离来度量样本间相似度，从而找到近邻点；然后，结合标签近邻点和萤火虫方法对标签计数向量进行改进；最后，使用奇异值分解（SVD）与核极限学习机（ELM）进行线性分类。该算法同时考虑了标签信息与相似度信息从而提高了鲁棒性。实验结果表明，所提算法较其他的多标签学习算法有一定优势，并使用统计假设检验与稳定性分析进一步说明所提出算法的合理性与有效性。

参考文献 | 相关文章 | 多维度评价

Select

12. 基于粗糙集的数据流多标记分布特征选择

程玉胜, 陈飞, 王一宾

计算机应用 2018, 38 (11): 3105-3111. DOI: 10.11772/j.issn.1001-9081.2018041275

摘要（481）

PDF （1135KB）（426）

针对传统特征选择算法无法处理流特征数据、冗余性计算复杂、对实例描述不够准确的问题，提出了基于粗糙集的数据流多标记分布特征选择算法。首先，将在线流特征选择框架引入多标记学习中；其次，用粗糙集中的依赖度替代原有的条件概率，仅仅利用数据自身的信息计算，使得数据流特征选择算法更加高效快捷；最后，由于在现实世界中，每个标记对实例的描述程度并不相同，为更加准确地描述实例，将传统的逻辑标记用标记分布的形式进行刻画。在多组数据集上的实验表明，所提算法能保留与标记空间有着较高相关性的特征，使得分类精度相较于未进行特征选择的有一定程度的提高。

参考文献 | 相关文章 | 多维度评价

Select

13. 基于残差神经网络的图像超分辨率改进算法

王一宁, 秦品乐, 李传朋, 崔雨豪

计算机应用 2018, 38 (1): 246-254. DOI: 10.11772/j.issn.1001-9081.2017061461

摘要（668）

PDF （1533KB）（576）

为更有效地提升图像的超分辨率（SR）效果，提出了一种多阶段级联残差卷积神经网络模型。首先，该模型采用了两阶段超分辨率图像重建方法先重建2倍超分辨率图像，再重建4倍超分辨率图像；其次，第一阶段与第二阶段皆使用残差层和跳层结构预测出高分辨率空间的纹理信息，由反卷积层分别重建出2倍与4倍大小的超分辨率图像；最后，以两阶段的结果分别构建多任务损失函数，利用第一阶段的损失指导第二阶段的损失，从而提高网络的训练速度，加强网络学习中的监督指导。实验结果表明，与bilinear算法、bicubic算法、基于卷积神经网络的图像超分辨率（SRCNN）算法和加速的超分辨率卷积神经网络（FSRCNN）算法相比，所提模型能更好地重建出图像的细节和纹理，避免了经过迭代之后造成的图像过度平滑，获得更高的峰值信噪比（PSNR）和平均结构相似度（MSSIM）。

参考文献 | 相关文章 | 多维度评价

Select

14. 基于风险决策的文本语义分类算法

程玉胜, 梁辉, 王一宾, 黎康

计算机应用 2016, 36 (11): 2963-2968. DOI: 10.11772/j.issn.1001-9081.2016.11.2963

摘要（499）

PDF （967KB）（467）

传统的文本分类多以空间向量模型为基础，采用层次分类树模型进行统计分析，该模型多数没有结合特征项语义信息，因此可能产生大量频繁语义模式，增加了分类路径。结合基本显露模式（eEP）在分类上的良好区分特性和基于最小期望风险代价的决策粗糙集模型，提出了一种阈值优化的文本语义分类算法TSCTO：在获取文档特征项频率分布表之后，首先利用粗糙集联合决策分布密度矩阵，计算最小阈值，提取满足一定阈值的高频词；然后结合语义分析与逆向文档频率方法获取基于语义类内文档频率的高频词；采用eEP分类方法获得最简模式；最后利用相似性公式和《知网》提供的语义相关度，计算文本相似性得分，利用三支决策理论对阈值进行选择。实验结果表明，TSCTO算法在文本分类的性能上有一定提升。

参考文献 | 相关文章 | 多维度评价

Select

15. 差分隐私二维数据流统计发布

林富鹏, 吴英杰, 王一蕾, 孙岚

计算机应用 2015, 35 (1): 88-92. DOI: 10.11772/j.issn.1001-9081.2015.01.0088

摘要（519）

PDF （760KB）（601）

目前关于差分隐私数据流统计发布的研究仅考虑一维数据流,其方法无法直接用于解决二维数据流统计发布中可能存在的隐私泄露问题.针对此问题,首先提出面向固定长度二维数据流的差分隐私统计发布算法——PTDSS算法.该算法通过单次线性扫描数据流,以较低空间消耗计算出满足一定条件的二维数据流元组的统计频度,并经过敏感度分析添加适量的噪声使其满足差分隐私要求;接着在PTDSS算法的基础上,利用滑动窗口机制,设计出面向任意长度二维数据流的差分隐私连续统计发布算法——PTDSS-SW.理论分析与实验结果表明,所提算法可安全地实现二维数据流统计发布的隐私保护,同时统计发布结果的相对误差在10%~95%.

参考文献 | 相关文章 | 多维度评价

Select

16. 基于面向方面和运行时反射技术的并行框架

张杨张冬雯王一拙

计算机应用 2014, 34 (11): 3096-3099. DOI: 10.11772/j.issn.1001-9081.2014.11.3096

摘要（176）

PDF （550KB）（493）

针对使用并行库JOMP的程序在性能方面存在的不足,提出一个可以分离并行逻辑和功能逻辑的并行框架。该框架对程序中需要并行处理的部分进行标记,采用面向方面和运行时反射技术实现被标记部分的处理,其中面向方面技术用于实现并行逻辑的分离和编织,运行时反射技术用于获取运行时被标记部分的相关信息,以并行库(waxberry)的方式实现了该并行框架。使用基准测试程序JGF套件中的三个测试程序对并行库进行了测试,实验结果表明,应用该并行库的程序可以获得较好的性能。

参考文献 | 相关文章 | 多维度评价

Select

17. 视图的秘密分享及其代数编码方法

王晓京方佳嘉蔡红亮王一丁

计算机应用 2012, 32 (03): 669-678. DOI: 10.3724/SP.J.1087.2012.00669

摘要（1017）

PDF （1792KB）（671）

视图的秘密分享是图像信息安全领域独具吸引力的研究问题。寻求秘密视图完全的(Perfect)和理想的(Ideal)门限秘密分享方案(也称图像门限分享的完备方案),则是其中富有挑战性的未决课题。文中引入灰度值域GF(2m)上像素矩阵秘密分享的新观点和相应的代数几何编码方法,实现了数字图像(t,n)门限秘密分享的一种完备方案。该方案能够将一幅或多幅秘密图像编码为n幅各具随机视觉内容,同时又共具(t,n)门限结构的影子图像(或称份额图像)。证明了这种秘密分享方案的(t,n)门限结构不仅是完全的而且也是理想的，并给出了提高像素灰度值域GF(2m)上图像秘密分享算法效率的“m位像素值的分拆与并行”方法。分析表明，该图像秘密分享方法可以应用于高安全等级的秘密图像的网络多路径传输、保密图像信息的分散式存储控制、高维图形码(Bar-code in k dimension)和弹出码(Popcode)等新一代信息载体技术的识读控制等各方面。

参考文献 | 相关文章 | 多维度评价

Select

18. 基于Matlab-Simulink-SISO及SRO的电磁轴承PID控制参数整定

王一丁李志蜀林建辉赵培

计算机应用

摘要（1415）

PDF （448KB）（915）

介绍了电磁轴承PID控制系统, 采用Matlab SISO SRO开发电磁轴承控制仿真系统,研究PID控制参数对电磁轴承控制的影响,给出在不同的PID控制参数下的仿真结果,为电磁轴承控制系统的设计提供了一种简洁高效的方法。